查看原文
其他

武侠都不敢这么写! 彻底拉下了经济学家遮羞布, 到底谁在背后弄你, 骂你?

计量经济圈 计量经济圈 2023-07-27

凡是搞计量经济的,都关注这个号了
邮件:econometrics666@126.com
所有计量经济圈方法论丛的code程序, 宏微观数据库和各种软件都放在社群里.欢迎到计量经济圈社群交流访问.
一切始于欧美经济学界一个著名网站,名为经济学招聘市场传闻(简称EJMR)。该网站类似于匿名社区,用户发言皆匿名,导致其中充斥着垃圾话、人身攻击以及各种歧视言论。尽管许多经济学者可能口头上不表态,但偶尔也会光顾此处,甚至可能参与讨论。

不过,最近耶鲁大学的三位学者破解了该网站上匿名发帖者的IP地址。这样,他们就能追踪到每条帖子是从哪个大学的校园发出来的。并且在7月20日,该项研究还将在NBER会议上进行宣讲,注定会引起经济学界的轰动。

你可以设想一下,前一秒还在学术会议上与你亲切地打招呼加微信,下一秒却在EJMR上恶意攻击你,例如,说毛咕噜天天灌水,诺奖得主duflo靠小三上位。

真可谓,经济学家们追求所有与人和物有关的数据,但当数据涉及到他们自己时,却不愿意接受!

文后链接里包含全文和PPT,展现了一种非常直接且激烈的表达方式,作者似乎既有对经济学家的批评之意,也充满了对私人生活的好奇。他的写作风格既有一种扶正扬善的义愤之情,又有一种八卦窥私的好奇心。
总结:
《经济学招聘市场传闻(Economics Job Market Rumors,简称EJMR)》是一个关于经济学学术就业市场信息的在线论坛和信息交流平台。然而,该平台上也存在大量滥用、诽谤、种族歧视、厌女等“有毒”内容。几乎所有这些内容都是由匿名贡献者创建的,他们在EJMR上发布时会获得一个四字符的用户名。通过仅使用公开可得的数据,本文展示了生成这些用户名的方案的统计特性,从而可以高概率地确定大多数帖子的IP地址来源。我们成功获取了47630个不同的EJMR贴主的IP地址,并将其与大约过去12年内产生的近700万篇帖子进行了匹配,成功率达66.1%。我们对帖子进行了地理定位,并描述了横截面上不同子论坛、地理位置、机构和贡献者之间的聚合变化,特别关注了有毒言论方面的情况。

*可以看看毒帖子在美国高校的分布,UCLA、耶鲁大学里竟然生产了最多的毒帖子,这些机构的经济学者到底有多喜欢在背后搞别人事情?
简要概览:
《经济学招聘市场传闻》([http://www.econjobrumors,以下简称EJMR)是一个匿名互联网留言板,为人们提供分享与经济学相关的信息的场所,尤其关注博士经济学家的就业市场。然而,该讨论板全年都活跃,EJMR的用户匿名发布有关经济学或其他问题的帖子。EJMR非常受欢迎:根据SimilarWeb的估计,EJMR每月接受250万次访问,平均每次访问浏览6.45页内容。相比之下,NBER和AEA竞争对手的相同数据为110万和99.1万次访问,每次访问浏览2.09和2.76页内容。除了提供信息的角色外,EJMR还是“滋生滥用个人攻击言论的温床”(Blanchard,2017),并且存在广泛的性别歧视言论,这是由Wu(2018)和Wu(2020)首次以系统的方式进行记录。
该网站上的匿名使用会导致激烈的讨论,用户经常发布有争议和煽动性的言论,包括个人攻击、骚扰和歧视行为。EJMR上分享的信息具有非正式和未经验证的性质,这也引起了争议。网站上发布的信息不受事实核查或验证,存在误导信息传播的风险。这可能导致关于工作机会、候选人和招聘流程的虚假传闻。此外,EJMR还延续和加剧了经济学领域现有的不平等现象,例如基于性别和种族的歧视。
尽管网站会自动删除很多冒犯性言论并进行严格的管理,但仍然有许多性别歧视、种族歧视或其他歧视性评论的例子。有时,这些评论是针对广泛群体的(例如,“女性的全部目的就是生孩子”或“美国的最大敌人是黑人”或“美国对黑人的战争失败了[...] 。”或“愚蠢中国人大学”或“普通女性的脑部比普通男性小15%”或“发表QJE的最快途径就是搬弄是非并且是个黑人”)。其他时候,它们针对特定个人(例如,“Jennifer Doleac因她对中国人的憎恨应该被处决吗?”或“Anya Samek[...]利用她最初的博士后职位组织与JL合作的会议并处理拨款提案请求,以窃取创意”或“Vrinda和Hampole是否在进行着秘密的同性恋仇恨关系?”)。
作为回应,超过1,000名签署者(https://www.iaffe.org/petition-aea-ejmr/)敦促美国经济学会(American Economic Association,AEA)创建一个经过审查、功能良好的网站,以提供最新的就业市场信息。AEA的CSWEP委员会(https://www.aeaweb.org/about-aea/committees/cswep/statement)也谴责“经济学招聘市场传闻(Economics Job Market Rumors,EJMR)”网站上出现的“性别歧视、种族歧视、同性恋恐惧和反犹太主义的言论,特别是针对特定学者的骚扰和侮辱。”然而,由AEA创建的论坛EconSpark和信息网站EconTrack在很大程度上失败了,几乎没有什么使用量,而EJMR的用户群体仍然庞大(见图6)。
有人对EJMR的代表性提出质疑,甚至声称在该平台上最频繁使用的用户实际上并非经济学家。然而,本文的分析显示,在EJMR上发布帖子的用户主要是经济学家,其中包括那些在学术界、政府和私营部门的高层工作的人员。
在本文中,我们确定了在EJMR上由匿名用户撰写的每篇帖子所使用的用户名分配方案。我们展示了该算法的统计特性并没有使帖子匿名化,相反,它允许以很高的概率确定每篇帖子的IP地址来源。
为了从EJMR的观察到的用户名中恢复IP地址,我们采用了多步骤的过程。首先,我们开发了基于GPU的软件,快速计算EJMR用户名分配算法所使用的SHA-1#。我们总共计算了近9000万亿次#,以完全列举所有可能的IP组合,并检查生成的#子串与观察到的用户名是否匹配。对于每个帖子,这大致将可能的IP地址集合从2的32次方缩小到2的16次方。其次,我们测量在狭窄的时间窗口内哪些IP地址出现频率特别高,并利用SHA-1#的均匀性属性来测试这些IP地址是否比随机情况下可能出现的频率更高。
本文的统计测试非常保守,最大程度地减少错误地将IP地址分配给帖子的概率,因为我们使用的p值阈值约为10^-11。例如,尽管EJMR上有7,098,111篇帖子,我们将所有帖子都没有分配到大量的错误IP地址集合中。尽管采取了这种非常保守的方法,本文的过程成功恢复了47,630个不同的EJMR贴主的IP地址,并将大约700万篇帖子中的66.1%分配给了这些IP地址。
然后,我们描述了EJMR上的帖子行为的聚合特征。根据我们所确定的IP地址的地理内容和相关联的互联网服务提供商的来源,本文显示在EJMR上发布帖子是普遍且非常常见的学术行为。超过10%的帖子来自包括美国所有排名靠前的大学在内的大学。相当数量的帖子也来自雇用经济学家的政府机构、公司和非营利组织。然而,绝大多数EJMR的帖子来自位于美国的居民IP地址,特别是位于拥有精英大学的城市。
与其他在线平台类似,EJMR上的帖子在发布者之间高度集中。仅有5%的IP地址产生了超过50%的帖子,而20%的IP地址产生了超过80%的帖子,而且这种集中现象在有毒帖子中更加明显。
然而,也有相当比例的帖子来自其他国家,包括加拿大、英国、香港、澳大利亚、德国、意大利和法国。EJMR用户倾向于在他们各自时区的工作时间和晚上发布帖子。虽然自EJMR成立以来,它一直是经济学家中受欢迎的网站,但自从COVID-19疫情爆发以来,网站上的帖子和互动数量在美国尤其激增。
本文显示,EJMR上的有毒言论普遍存在,超过10%的帖子被分类为有毒。与来自大学、政府机构和私营部门的IP地址相比,有毒帖子更有可能来自居民IP地址。

下面这个表展示了哪个学校的IP更会发表围绕其他某个学校的帖子,例如,Harvard学者竟然最喜欢在EJMR讨论MIT相关的经济学话题。

**社群里也上传了相应的PDF和PPT,可直接下载。

一些社群学术讨论:1.“显著不显著的后背是什么, 非(半)参估计里解决内生性”,2.“计量社群里关于使用交互项还是中介效应分析开展机制研究的讨论”,3.“为啥面板数据回归中, 即使X对Y的解释程度很大, 但R-square一般都很小?”,4.多期DID中使用双向固定效应可能有问题! 又如何做平行趋势检验? 多期DID方法的最新进展如何?,5.收入和年龄等变量是将其转化成有序离散变量还是当成连续变量进行回归呢?6.控制变量就能影响结果显著性, 所以存在很大操作空间, 调参数是常用手段吗?7.回归中常数项显著说明模型中有遗漏变量问题?8.审稿人有义务告诉你回归中可能的遗漏变量么?9.针对很多实证问题的讨论, 随手保存的部分内容以飨学者,10.未引入交互项主效应为正, 引入后变为负, 解释出来的故事特别好, 主效应符号确实增强了故事性,11.双向固定效应多期DID最新进展和代码汇总, 关于控制变量和固定效应选取的讨论,12.逐年匹配的PSM-DID操作策略, 多时点panel政策评估利器,13.多期DID前沿方法大讨论, e.g., 进入-退出型DID, 异质性和动态性处理效应DID, 基期选择问题等,14.针对经济学领域中介效应模型问题的回应和理性讨论,15.讨论a(b)对b(a)的新方向论文, 经济学期刊分区问题, 3个机制存在时计量模型设计问题,16.如果解决了内生性, 那么是否意味着证实了变量之间的因果关系呢?17.解释变量提升一个标准差,被解释变量提升几个百分比呢?18.关于DID中对照组与处理组的比例问题?19.双重差分法和事件研究法的区别主要在哪里?20.双重差分法和事件研究法的区别主要在哪里?21.统计上不显著的变量表明该变量对结果变量没有影响吗?22.IV与Y在理论上无直接关系, 但用Y对IV做回归发现IV是显著的, 这是咋回事?23.Heckman模型和工具变量IV之间的差异?24.被质疑: X与Y相关系数与回归系数截然相反, 你咋想的?25.审稿人质问: 通篇都基于OLS估计, 却把它放到稳健性检验或进一步讨论中!26.异质性和机制检验都用交互项做会被审稿人质疑么? 27.所有控制变量都不显著行不行呢?审稿人啥看法,28.审稿人: 实证论文必须先提出假说, 再依次进行实证检验么?

下面这些短链接文章属于合集,可以收藏起来阅读,不然以后都找不到了。

5年,计量经济圈近1500篇不重类计量文章,

可直接在公众号菜单栏搜索任何计量相关问题,

Econometrics Circle




数据系列空间矩阵 | 工企数据 | PM2.5 | 市场化指数 | CO2数据 |  夜间灯光 | 官员方言  | 微观数据 | 内部数据

计量系列匹配方法 | 内生性 | 工具变量 | DID | 面板数据 | 常用TOOL | 中介调节 | 时间序列 | RDD断点 | 合成控制 | 200篇合辑 | 因果识别 | 社会网络 | 空间DID

数据处理Stata | R | Python | 缺失值 | CHIP/ CHNS/CHARLS/CFPS/CGSS等 |

干货系列能源环境 | 效率研究 | 空间计量 | 国际经贸 | 计量软件 | 商科研究 | 机器学习 | SSCI | CSSCI | SSCI查询 | 名家经验

计量经济圈组织了一个计量社群,有如下特征:热情互助最多前沿趋势最多、社科资料最多、社科数据最多、科研牛人最多、海外名校最多。因此,建议积极进取和有强烈研习激情的中青年学者到社群交流探讨,始终坚信优秀是通过感染优秀而互相成就彼此的。


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存